文件上传
假设网站需要上传文件
1 | import requests |
Cookies
获取cookies
1 | import requests |
设置cookies
1 | import requests |
Session 会话维持
直接利用get或者post方法的确可以模拟登陆,但是实际上,每一次的get或者post相当于打开了不同的会话。例如当你第一次使用post()登陆了知乎后;第二次想获取登陆成功后的个人信息页面,实际上你是打开了一个新的会话窗口,与第一次会话无关,所以你无法获取个人信息页面,当然你可以在第二次的请求中携带cookies,但是每次请求都要携带十分的繁琐,这时候我们就可以利用Session来维持会话。Session对象会帮你维护一个会话,自动处理cookies。
1 | import requests |
SSL 证书
当发送http请求的时候,会检查ssl证书,使用verify参数来控制是否检查这个证书,默认是True,会自动检验。
1 | import requests |
代理
大规模爬取数据的时候,需要设置代理,以免客户端直接封禁我们的ip。
1 | import requests |
超时设置
1 | import requests |
身份认证
1 | import requests |
Prepared Request
讲请求表示为数据结构,其中各个参数都可以通过一个Request对象来表示。
1 | from requests import Request,Session |